期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 基于ARM+FPGA异构平台的目标检测加速模块设计与实现
李放, 曹健, 李普, 谢豪, 赵雄波, 王源, 张兴
北京大学学报自然科学版    2022, 58 (6): 1035-1041.   DOI: 10.13209/j.0479-8023.2022.089
摘要539)   HTML    PDF(pc) (814KB)(233)    收藏
为解决基于深度学习目标检测模型规模大、在边缘设备上难以部署的问题, 以YOLO目标检测模型为例, 设计实现基于ARM+FPGA异构平台的目标检测加速模块。该系统使用剪枝、量化后的压缩模型, 在FPGA实现神经网络前向推理加速, 在ARM中实现加速器调度。实验结果表明, 部署至Xilinx ZCU102开发板上, 该模块在200 MHz工作频率下, 平均计算性能达到425.8 GOP/s, 推理压缩模型速度达到30.3 fps, 模块功耗为3.56 W, 证明该加速模块具备可配置性。
相关文章 | 多维度评价 | 评论0
2. 基于FPGA的SSD目标检测硬件加速器设计
谢豪, 曹健, 李普, 赵雄波, 张兴
北京大学学报自然科学版    2022, 58 (6): 1015-1022.   DOI: 10.13209/j.0479-8023.2022.096
摘要738)   HTML    PDF(pc) (1316KB)(277)    收藏
设计了一种基于FPGA的目标检测算法的硬件加速器, 采用循环分块和循环展开的方式来优化卷积池化循环, 可以以任意并行度进行卷积和池化计算。使用一种基于AXI总线的数据重排序方式, 在不带来额外硬件资源开销的情况下, 对特征图进行重排序, 可以降低数据传输时间。将该硬件加速器部署至Xilinx ZCU 102开发板进行验证, 结果表明SSD算法前向推理性能为534.72 GOPS, 推理时间为113.81 ms。
相关文章 | 多维度评价 | 评论0
3. 基于离群值去除的卷积神经网络模型训练后量化预处理方法
徐鹏涛, 曹健, 陈玮乾, 刘晟荣, 王源, 张兴
北京大学学报自然科学版    2022, 58 (5): 808-812.   DOI: 10.13209/j.0479-8023.2022.082
摘要402)   HTML    PDF(pc) (452KB)(249)    收藏
为了提高训练后量化模型的性能, 提出一种基于离群值去除的模型训练后量化预处理方法。该方法仅通过排序、比较等简易的操作, 实现权重、激活值的离群值去除, 使模型在量化时仅损失少量的信息, 从而提升量化模型的精度。实验结果表明, 在使用不同的量化方法前, 采用所提方法进行预处理, 可显著地提升性能。
相关文章 | 多维度评价 | 评论0
4. 基于可融合残差卷积块的深度神经网络模型层剪枝方法
徐鹏涛, 曹健, 孙文宇, 李普, 王源, 张兴
北京大学学报自然科学版    2022, 58 (5): 801-807.   DOI: 10.13209/j.0479-8023.2022.081
摘要501)   HTML    PDF(pc) (846KB)(203)    收藏
针对当前主流的剪枝方法所获得的压缩模型推理时间较长和效果较差的问题, 提出一种易用且性能优异的层剪枝方法。该方法将原始卷积层转化为可融合残差卷积块, 然后通过稀疏化训练的方法实现层剪枝, 得到一种具有工程易用性的层剪枝方法, 兼具推理时间短和剪枝效果好的优点。实验结果表明, 在图像分类任务和目标检测任务中, 该方法可使模型在精度损失较小的情况下获得极高的压缩率, 优于先进的卷积核剪枝方法。
相关文章 | 多维度评价 | 评论0
5. 基于晶圆键合工艺的光刻掩膜版排版方法
尹卓, 苏悦阳, 罗代艳, 马莹, 王刚, 朱娜, 刘力锋, 吴汉明, 张兴
北京大学学报自然科学版    2021, 57 (5): 823-832.   DOI: 10.13209/j.0479-8023.2021.023
摘要933)   HTML    PDF(pc) (12090KB)(143)    收藏
晶圆–晶圆键合技术突破了传统晶圆平面工艺, 但键合晶圆的光刻对准图形及其他辅助图形有特殊的位置摆放和形貌绘制要求, 而传统方法进行光刻掩膜版排版费时费力且极易出错。针对该技术挑战, 提出一种与传统排版方式不同的整体翻转式排版方法: 在面对面晶圆–晶圆(两片)产品排版中, 通过“替换–翻转”过程, 可以快速有效地一次性解决辅助图形单元形貌和位置的对应翻转, 大幅度减少键合产品排版的工作量, 降低错误率, 有效地缩短产品导入时间周期。
相关文章 | 多维度评价 | 评论0
6. 等离子体刻蚀中边缘离子轨迹的控制与优化
李国荣, 赵馗, 严利均, Hiroshi Iizuka, 刘身健, 倪图强, 张兴
北京大学学报自然科学版    2019, 55 (6): 1002-1006.   DOI: 10.13209/j.0479-8023.2019.066
摘要1220)   HTML    PDF(pc) (7579KB)(329)    收藏
由于常规等离子体刻蚀系统在晶圆边缘处的阻抗与晶圆中心处的阻抗不一致, 使离子在晶圆边缘处的运动轨迹发生偏移, 很难满足越来越高的刻蚀工艺均匀性及深宽比的要求。本文提出一种通过调整晶圆边缘阻抗进行边缘离子运动方向优化的方法, 可以连续实时地调整边缘离子的运动轨迹, 实现对边缘离子运动方向的控制。研究结果表明, 离子的运动方向可以被优化为垂直于晶圆表面, 从而能获得良好的刻蚀速率均匀性及垂直的刻蚀形貌。
相关文章 | 多维度评价 | 评论0
7. 基于AETA监测数据的地震预测研究
王新安, 雍珊珊, 黄继攀, 吕亚轩, 张兴, 梁意文
北京大学学报自然科学版    2019, 55 (2): 209-214.   DOI: 10.13209/j.0479-8023.2019.007
摘要1405)   HTML    PDF(pc) (12883KB)(247)    收藏

针对2017年8月8日中国四川省九寨沟县Ms 7.0级地震事件, 分析AETA地震前兆监测设备上地震前后的数据。结果显示, 四川地区已安装的36个台站中, 有13个出现相关异常, 其中9个台站为密切相关。在异常台站中发现一种与日升日落几乎同步的电磁扰动均值波形(称为SRSS波), 有11个台站在震前出现该波形。采用 PCAETA算法对这11个台站的数据进行分析, 计算得到九寨沟防震减灾局AETA台站(104.25°E, 33.26°N)的波形震前震后出现明显的异常条带, 2017年8月12日至11月20日冕宁防震减灾局AETA台站(102.17°E, 28.55°N)的AETA波形也出现震前异常条带。结果表明, AETA设备可在地震发生前捕捉到多点的密切相关的前兆异常, SRSS波的条带异常现象是比较明确的临震前兆特征。

相关文章 | 多维度评价 | 评论0
8. 异步低功耗RSA电路结构的设计和实现
张奇惠, 曹健, 曹喜信, 于敦山, 张兴
北京大学学报自然科学版    2018, 54 (6): 1351-1354.   DOI: 10.13209/j.0479-8023.2018.046
摘要808)   HTML    PDF(pc) (2003KB)(204)    收藏

提出一种适用于智能卡和电子标签的异步低功耗RSA电路结构及其模乘电路结构, 使用GTECH的优化方法和BrzCallMux的实现策略, 基于TSMC 130 nm CMOS标准工艺进行ASIC实现。结果表明, 所提出的异步低功耗RSA的面积最低仅为其他RSA面积的4%, 一次加解密时间最低仅为其他RSA加解密时间的0.216%, 功耗最低仅为其他RSA功耗的16.99%。

相关文章 | 多维度评价 | 评论0
9. 一种改进的基于人体静电冲击模型应力的瞬态功率模型
曹鑫, 曹健, 王艺泽, 王源, 张兴
北京大学学报自然科学版    2018, 54 (5): 946-950.   DOI: 10.13209/j.0479-8023.2018.044
摘要695)   HTML    PDF(pc) (510KB)(85)    收藏

提出一种改进的基于人体静电冲击模型(Human Body Model, HBM)应力的瞬态功率模型。利用HSPICE仿真软件, 模拟MOS管遭受的HBM应力, 得到对应的等效直流电压。HBM电路的预充电电压与MOS管对应的等效直流电压值的散点图表明, 两者保持线性关系, 并通过拉普拉斯变化得到证明。与现有的瞬态功率模型相比, 改进后的模型降低了在HBM应力作用下的计算复杂度, 可以更加简便地从统计学上预测MOS管栅氧击穿的发生, 给HBM冲击作用下MOS管栅氧化层可靠性的评估提供参考。

相关文章 | 多维度评价 | 评论0
10. 多分量地震监测系统AETA的研究与实现
王新安, 雍珊珊, 徐伯星, 梁意文, 白志强, 安辉耀, 张兴, 黄继攀, 谢峥, 林科, 何春舅, 李秋平
北京大学学报(自然科学版)    2018, 54 (3): 487-494.   DOI: 10.13209/j.0479-8023.2017.171
摘要1172)   HTML9)    PDF(pc) (2073KB)(264)    收藏

研制多分量地震监测系统AETA(acoustic & electro-magnetic testing all in one system)。在云南、四川、西藏、河北、北京、广东等地区的现场实验表明, 该系统能够满足大区域密集布设中高灵敏度、低成本和易布设的需求。同时, 若干点的实验观测数据和均值、振铃率、峰值频率在一定程度上反映了映震效果。目前正在中国西南部、首都圈、台湾海峡等地区密集布设, 系统地开展映震效果研究。

相关文章 | 多维度评价 | 评论0
11. 一种基于TLP输入的系统级ESD模型分析方法
王艺泽, 王源, 曹健, 张兴
北京大学学报(自然科学版)    2018, 54 (2): 293-298.   DOI: 10.13209/j.0479-8023.2017.146
摘要1044)   HTML2)    PDF(pc) (1671KB)(329)    收藏

基于已有的传输线脉冲发生器(TLP)与IEC 61000-4-2应力的等效关系, 提出一种以TLP应力作为输入的系统级模型分析方法。与传统的IEC应力作为系统输入的分析方法相比, 该方法解决了对流入待测器件(DUT)残余能量的计算不够精确的问题, 同时提高了DUT失效预测方面的精准性。通过SPICE仿真, 预测了上述两种应力作为系统输入的DUT失效情况。通过相应的印制电路板(PCB)的实测验证, 进一步说明新提出的方法能够提高系统级失效预测的精准性。

相关文章 | 多维度评价 | 评论0
12. 用于北斗二代/GPS接收机的低功耗自动增益控制策略
侯中原,刘军华,廖怀林,张兴
北京大学学报(自然科学版)   
摘要762)      PDF(pc) (2130KB)(528)    收藏
提出一种用于北斗二代/GPS兼容系统的自动增益控制策略, 并采用数模混合的结构实现55 dB增益控制范围及简单的反馈控制环路。此策略通过复用模数转换器的采样结果,自动调整电压控制增益放大器和数控增益放大器的增益。与传统自动增益放大器相比较, 无需功率检测器或者检波器, 大大降低了功耗水平。此增益控制策略在台积电 0.18 μm工艺下进行验证。测试结果显示其建立时间小于1 ms, 仅消耗2 mA功耗, 符合在北斗二代和GPS系统对自动增益控制电路的指标要求。
相关文章 | 多维度评价 | 评论0
13. 基于FPGA与DLP的体三维显示系统设计方法与研究
曹健,焦海,王源,张兴
北京大学学报(自然科学版)   
摘要756)      PDF(pc) (2712KB)(473)    收藏
提出一种基于FPGA和DLP的旋转体三维图像生成系统的设计方法。该方法使用FPGA搭建成像处理单元, 对图像抖动与图层叠加算法处理后的合成图像视频流进行传输控制。视频流经SD卡存储控制单元、DDR2高速内存控制单元、像素帧处理和HDMI高清图像发送模块, 由DLP投影仪内的图像处理单元进行解码, 并将解码后的数字信号转化为光信号, 投射到高速旋转接收屏。该方法可使观测者在不佩戴3D眼镜的情况下, 从高速旋转屏中观看到物体多角度的三维空间立体图像。
相关文章 | 多维度评价 | 评论0
14. 基于有限状态机的硬件木马设计和插入
李蕾, 尚子靖, 冯建华, 张兴, 安辉耀
北京大学学报(自然科学版)   
摘要742)      PDF(pc) (1737KB)(582)    收藏
针对集成电路设计和制造中存在的硬件木马问题, 提出一种新的模型来提高木马检测能力。该模型基于有限状态机, 比组合电路型木马难于触发和检测。同时, 木马电路插入位置的选择也可以有效规避路径延时检测方法。实验选择ISCAS’89基准电路中的S349作为目标电路, 对功能和延时信息进行仿真。实验结果表明, 这种类型的木马难于激活, 并且选择合适的插入位置可以有效隐藏延时信息。
相关文章 | 多维度评价 | 评论0
15. 基于多粒度感知SVM的复杂场景人车分类方法
吴金勇,赵勇,王一科,袁誉乐,张兴
北京大学学报(自然科学版)   
摘要787)      PDF(pc) (1425KB)(491)    收藏
针对复杂场景中的人车分类问题, 提出一种基于多粒度感知SVM (support vector machine)的复杂场景人车分类方法。该方法首先对视频场景进行运动区域分析, 结合角点检测方法提取运动区域视觉感知信息, 在时空域中采用Kalman滤波将感知信息进行关联推理, 去除噪声干扰。 再以运动区域质心点为中心, 构造目标的多粒度感知特征, 最后构造2级SVM分类器, 将目标多粒度感知特征向量集输入SVM分类器进行训练及分类, 得到人车分类结果输出。实验结果表明, 该方法取得了良好的分类效果, 人、车全天候平均分类正确率分别达到93.6%以上, 能有效避免光照、色彩、目标大小等变化导致的误分类问题, 适用于智能交通视频的人车分类应用。
相关文章 | 多维度评价 | 评论0
16. CmDSP: 一种可配置媒体数字信号处理器
胡子一,赵勇, 王新安,王腾,谢峥,黄如,张兴
北京大学学报(自然科学版)   
17. 一款工作于2.4 GHz频段的带有源负载的高性能双平衡有源混频器
姜梅,张兴,王新安,刘珊,徐锋,汪波,宗洪强,沈劲鹏
北京大学学报(自然科学版)   
18. 改进的基于GSM标准二阶多位噪声耦合过采样调制器
李宏义,王源,贾嵩,张兴
北京大学学报(自然科学版)   
19. MASH21 Sigma-Delta调制器的自顶向下设计
葛彬杰,王新安,张兴,冯晓星,汪清勤
北京大学学报(自然科学版)   
摘要786)      收藏
提出MASH21调制器的自顶向下设计方法。在系统级, 通过系数缩放对积分器的输出进行限制; 在电路级, 通过积分器的瞬态建模分析运放非理想因素对调制器的影响, 并得到SNR和面积功耗最优的设计区域。通过一个数字音频MASH21调制器的设计对此方法进行了验证。该调制器基于TSMC18MMRF工艺实现, 在1.8 V的单电压下工作, 测试显示调制器的SNDR达到91 dB。
相关文章 | 多维度评价 | 评论0
20. 可重构视频编解码处理器ReMAP设计
戴鹏, 雍珊珊, 王新安, 张兴
北京大学学报(自然科学版)   
摘要569)      收藏
针对当前视频高清编解码的计算密集性、并行性和数据局部性的特点, 提出一个粗粒度的可重构处理器ReMAP-2。该处理器由一个可重构的计算单元阵列构成,通过由临近直联和分段式总线组成的互联网络完成数据通信任务, 具有良好的扩展性。计算阵列针对不同应用,通过加载不同配置信息流实时改变运算单元的计算功能和连接方式,支持多种格式的视频编解码应用。仿真验证表明, 可重构处理器 ReMAP-2 在视频编解码应用时较常用的媒体处理器具有较大幅度的性能加速, 处理性能达到或接近于ASIC水平,同时具有较高的应用灵活性。
相关文章 | 多维度评价 | 评论0
21. 一种具有新型时钟产生器的无源超高频 RFID 标签
冯晓星, 王新安, 张兴, 葛彬杰
北京大学学报(自然科学版)   
摘要545)      收藏
给出一种符合 ISO/IEC 18000-6B 协议的超低功耗的无源超高频 RFID 标签。为了能够给标签数字基带处理提供准确的时钟, 使用了一种超低功耗、自校正的时钟产生器, 产生的时钟在-50℃~120 ℃或者 0.7~1.6 V 电源电压的范围内, 偏差小于 4%。此自校正时钟模块的功耗在 0.7 V 的电源电压下仅为 364 nW。一个低压输出参考电压源也集成到了该标签芯片中, 该模块产生 0.96 V 的基准且只消耗 100 nA 的电流。采用门控时钟和模块复用使功耗降低至 1.17 μW。该设计采用 0.18μm 的混合信号 CMOS 工艺, 整个面积为 0.75mm ×0.75mm 。测试结果显示该标签的灵敏度达到-10 dBm。
相关文章 | 多维度评价 | 评论0
22. 使用嵌入式处理器 的水声调制解调器控制系统设计方法与研究
李莹,Bridget Benson,于敦山,Ryan Kastner,张兴
北京大学学报(自然科学版)   
摘要698)      收藏
提出了一种使用带有嵌入式处理器的FPGA 实现水声调制解调器控制系统的方法, 根据声波通信的数据特点选择适合的通信总线搭建系统结构, 设计出合理的软硬件协同工作流程和中断控制信号。通过在Xilinx VirtexIVFPGA 的嵌入式 MicroBlaze 软处理器上实现并通过软硬件协同验证, 表明所设计的控制系统能够准确控制整个数字信号处理过程, 实时监控电路工作情况, 性能稳定可靠。
相关文章 | 多维度评价 | 评论0
23. ReSim: 一个面向可重构处理器的仿真平台
戴鹏,魏来,辛灵轩,王新安,张兴
北京大学学报(自然科学版)   
摘要1216)      收藏
针对可重构处理器 ReMAP( reconfigurable multimedia array processor) 面向视频高清编解码提出的灵活互联、计算资源密集、易于扩展的结构优化需求, 提出了一个基于模块化分层设计、时钟周期精确的可重构处理器仿真平台ReSim。该仿真器基于3 级软件框架层次搭建, 设计了可快速仿真多种互联结构的互联模块、多种计算模型的控制模块等模块化功能单元, 结合时钟驱动模块对全局系统结构的运行驱动, 可快速搭建可重构处理器的目标仿真模型, 验证其正确性和有效性, 精确评估计算性能, 具有可视化、易于调试的特点。经实际测试表明, ReSim 对可重构处理器 ReMAP-2 架构的系统评估与验证予以良好的支持。
相关文章 | 多维度评价 | 评论0
24. 高灵敏度GPS接收机捕获电路的优化与实现
路卫军,黄永灿,于敦山,张兴
北京大学学报(自然科学版)   
摘要600)      收藏
基于传统的时域并行相关的能量检测技术提出一种资源优化方法, 通过两步相关法和分时共享技术进行相干积分, 对某一估计频率下的 1023 个不同的码相位进行并行处理, 在采样频率为 16. 368 MHz 的条件下所需相关器数量减少为未优化前的 1/ 102. 3。用 Verilog 硬件描述语言实现了采用优化技术的能量检测器, 给出了FPGA 实现结果和 Design Compiler 的综合结果。测试结果表明, 在预检测积分时间为 2s, C/N0 = 21dB-Hz, 虚警概率为0. 097% 时, 捕获概率可达到90%。
相关文章 | 多维度评价 | 评论0
25. 一种适用于折叠插值型ADC的新型编码器
刘振,贾嵩,王源,吉利久,张兴
北京大学学报(自然科学版)   
摘要727)      收藏
提出了一种新的适用于折叠插值型ADC的高速低功耗的编码器。该编码器使用异或-或算法完成码制转换,并且利用新的串并联多米诺电路来实现。另外,还提出了一种新的宽范围的误差校正和位同步方法应用于此编码器中。仿真结果表明,此种新型编码器的功耗延迟积比常用的ROM 编码器降低了约56%,而且更适用于较高位数的折叠插值型ADC中。
相关文章 | 多维度评价 | 评论0
26. 无线传感器网络节点中AES协处理器的设计
李玉文,张兴,蒋安平
北京大学学报(自然科学版)   
摘要726)      收藏
针对无线传感器网络的特点,采用加解密复用,子模块复用技术,低成本MixColumn模块的设计,以及操作数隔离,编码优化,动态功耗管理等方法,基于Xilinx公司的Virtex4系列FPGA,完成了用于无线传感器网络节点中的AES-128加解密算法协处理器的优化设计以及FPGA实现。该设计处理速度、面积功耗等都满足常用无线传感器网络节点的要求。
相关文章 | 多维度评价 | 评论0
27. 一种在FPGA上实现FIR数字滤波器的资源优化算法
李莹,路卫军,于敦山,张兴
北京大学学报(自然科学版)   
摘要662)      收藏
针对原有在FPGA上实现高速FIR滤波器的移位加算法,进一步分析了算子调度的具体过程,讨论了在不同情况下该算法所能达到的最省资源的算子调度方案,并提出了优化的具体规则。在Xilinx spartan3系列FPGA上的实现结果表明,对于16阶固定系数FIR滤波器,相比于原有的移位加算法以及Xilinx CoregenTM生成的同等规模的分布式算法滤波器,采用优化算法后的FIR滤波器可节省资源分别达11.7%和29.7%。
相关文章 | 多维度评价 | 评论0
28. 一款精度高、响应速度快的电流检测电路
姜梅,王新安,马新闻,张兴
北京大学学报(自然科学版)   
摘要825)      收藏
提出一种应用于电流模的PWMDC-DC转换器系统、利用senseFET作电流检测器件的新颖的电流检测电路。该电路结构简单,易于集成,具有功耗低、频率特性好、响应速度快、不降低电源系统的工作效率等优点。同时,该电路在很大的负载电流范围内实现高精度的电流检测功能。芯片利用CSMC0.5μm 2p3M 3.3V CMOS工艺实现。这款降压芯片能够在1.2~2MHz的频率范围内将输入的2.5~5.5V的直流电源电压转换为1.5V的稳定直流电压输出,完全适用于单节锂电池电源的系统。在50~600mA的负载电流范围内,测试检测电流的精度最高可达到97.75%。
相关文章 | 多维度评价 | 评论0
29. 适合SoC应用的片上集成输出电容快速响应LDO
沈良国,张兴,赵元富
北京大学学报(自然科学版)   
摘要834)      收藏
提出了适合SoC应用的片上集成输出电容快速响应低压差线性稳压器(LDO)。通过使用一种新颖的双向非对称缓冲器,消除了由LDO传输元件寄生电容产生的右半平面零点。该零点的消除不仅提高了LDO的稳定性,而且可以有效拓展其单位增益带宽,从而改善瞬态响应性能。基于该缓冲器的LDO,其相位裕度大于55°,单位增益带宽可达1.7MHz,在负载电流以50mA/μs的速度阶跃变化时输出电压变化量小于100mV。
相关文章 | 多维度评价 | 评论0
30. 一种适用于77 K下读出电路的电流源
唐矩,鲁文高,陈中建,吉利久,张兴
北京大学学报(自然科学版)   
摘要655)      收藏
给出了一种应用于低温光敏探测器读出电路的可编程电流源,工作在液氮环境(77 K),无外加单元,与一般电流源设计不同,本设计将部分MOS管设计在亚阈值区工作来提高电路工作稳定性。此电流源设计采用0.5 μm标准CMOS工艺。工作电压为5 V。室温测试当工作电压从2.3 V到6.4 V变化时,输出电流从199 nA变化到212 nA,精度为1.4%/V。在液氮环境测试当工作电压从3V到6.8 V变化时,输出电流从355 nA变化到372 nA,精度为1.3%/V。由于电路工作温度稳定,所以不要求电流源有良好的对温度稳定性。
相关文章 | 多维度评价 | 评论0